华为开发者贡献Linux内核补丁,将核心内核函数速度提升715倍
目前,要搜索一个符号,我们需要将 'kallsyms_names' 中的符号一个一个展开,然后使用展开后的字符串进行比较。这种算法的时间复杂度是 O (n)。
如果我们像地址一样按升序对名称进行排序,则可以使用二分查找。这种算法的时间复杂度是 O (log (n))。
为了不改变 “/proc/kallsyms” 的实现,表 kallsyms_names [] 仍然按照升序与地址一一对应存储。
添加数组 kallsyms_seqs_of_names [],以排序后的 names 序号为索引,对应的内容为排序后的地址序号。例如:假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引为 'i',kallsyms_seqs_of_names [i] 的内容为 'k',则 NameX 对应的地址为 kallsyms_addresses [k]。kallsyms_names [] 中的偏移量是 get_symbol_offset (k)。
请注意,使用此方法内存使用量将增加 (4 * kallsyms_num_syms) 字节,接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。
性能测试结果:(x86)
Before:
min=234, max=10364402, avg=5206926
min=267, max=11168517, avg=5207587
After:
min=1016, max=90894, avg=7272
min=1014, max=93470, avg=7293
kallsyms_lookup_name () 的平均查找性能提高了 715 倍。
往期推荐
《2022 年度 OSC 中国开源项目评选》正式启动
2022需求最大的8种编程语言
点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦~